import pandas as pd

# 读取两个 Excel 文件
file1 = "combined_problems_infoB4.xlsx"  # 需要添加到的文件
file2 = "problems_info_updatedB3.xlsx"  # 已存在的文件

# 加载数据
df1 = pd.read_excel(file1)
df2 = pd.read_excel(file2)

# 合并两个 DataFrame
combined_df = pd.concat([df1, df2], ignore_index=True)

# 按照题号的数字部分升序排序，保留原始题号格式
combined_df['Problem Number'] = combined_df['Problem Number'].astype(str)  # 确保题号是字符串格式
combined_df['Sort Order'] = combined_df['Problem Number'].str.extract('(\d+)').astype(int)  # 提取数字部分用于排序

# 按照提取的数字部分进行排序
combined_df = combined_df.sort_values(by='Sort Order').reset_index(drop=True)

# 删除辅助列
combined_df = combined_df.drop(columns=['Sort Order'])

# 将合并后的 DataFrame 写入新的 Excel 文件
combined_df.to_excel("combined_problems_infoB5.xlsx", index=False)

print("合并完成，已保存为 combined_problemsinfoB1.xlsx")
